SF33594
2 jours
Formation Spark SQL.
2 journées de formation pour maîtriser le module Spark pour le traitement des données structurées !
A l'issue de cette formation, les participants sont en mesure de réaliser des analyses de données avec Spark SQL. Ils maîtrisent l'installation et la configuration de l'outil, et sont en mesure de requêter et visualiser des jeux de données dans différents formats.
Programme de formation Spark SQL.
PDFIntroduction à la formation Spark SQL
Présentation générale de la formation, objectifs et approche pédagogiques
Les différentes approches pour l’accès aux données avec Spark : Hive, bases de données…
Les fonctionnalités et l’architecture de Spark
Installer Spark et effectuer les configurations de base
Le module Spark SQL : fonctionnalités, intérêt et avantages par rapport à Hive
Principes de fonctionnement et architecture (Data Source API, DataFrameAPI, SQL Service…)
Requêtes, DataFrames et DataSets
Comprendre les DataFrames dans Spark
Le point de départ : SparkSession
Créer des DataFrames
Requêtes SQL de base
Vues temporaires
Créer des DataSets
Exécuter des agrégations, jointures et requêtes imbriquées
Requêtes sur différents types de données
Accéder aux données
Préparer les données
Schémas RDD
Requêter des fichiers JSON, Parquet, CSV…
Troubleshooting
Mise en cache In-Memory
Vous serez également interessé·e par ces formations.
Formation Spark
Formation Langage SQL
Formation SQL Perfectionnement
Nos autres formations en SGBD (Systèmes de Gestion de Base de Données) .
Formation Administration des solutions Microsoft Azure SQL (DP-300)
Formation Bases de données : l’essentiel
Formation Bases de données NoSQL : introduction, enjeux et panorama des solutions
Formation Cassandra
Formation HBase : mise en œuvre et administration
Formation Ingres Administration
A travers sa Charte Engagement Qualité, Sparks s’engage à tout mettre en œuvre pour que chaque session de formation soit un succès et que votre satisfaction soit totale.